Știri
Știri din categoria Inteligență artificială

Apple a prezentat Ferret-UI Lite, un model AI compact care poate naviga autonom în aplicații direct pe dispozitiv, fără a trimite date în cloud, potrivit lucrării publicate pe arXiv. Modelul are 3 miliarde de parametri, dar, susțin autorii, egalează sau depășește performanța unor agenți pentru interfețe grafice de până la 24 de ori mai mari.
Ferret-UI Lite este un model multimodal conceput pentru a înțelege și a interacționa cu interfețe de aplicații mobile, web și desktop. Scopul este rularea integrală pe dispozitiv, ceea ce ar permite asistenților virtuali să execute sarcini în numele utilizatorului fără ca informațiile sensibile să părăsească telefonul sau calculatorul.

Principala dificultate pentru modelele mici este interpretarea elementelor dense și de dimensiuni reduse de pe ecran. Apple a introdus o tehnică numită „decupare în faza de inferență”, care presupune două etape:
Antrenarea a fost realizată și cu ajutorul unui sistem sintetic, bazat pe patru roluri simulate – generator de sarcini, planificator, executor și critic – care reproduc interacțiuni reale, inclusiv erori precum atingeri nereușite sau ferestre pop-up neașteptate. Astfel, modelul a fost învățat să corecteze greșeli și să își continue sarcina.
Conform datelor prezentate în lucrare:
Pe ScreenSpot-Pro, modelul a depășit alți agenți de 3 miliarde de parametri cu peste 15 puncte procentuale.

Publicarea cercetării vine în contextul pregătirii unei versiuni modernizate a asistentului Siri, așteptată în primăvara lui 2026, odată cu iOS 26.4. Un model capabil să „citească” și să opereze aplicații local ar putea sta la baza unor funcții avansate, precum executarea de sarcini complexe în mai multe aplicații consecutive.
Apple subliniază avantajul confidențialității: rularea pe dispozitiv ar însemna că mesaje, date financiare sau informații medicale nu sunt transmise către servere externe.
Autorii recunosc că modelul performează mai bine în sarcini scurte și directe și întâmpină dificultăți în operațiuni complexe, cu mai mulți pași. Deocamdată, nu există confirmarea integrării Ferret-UI Lite într-un produs comercial, însă direcția cercetării indică intenția Apple de a dezvolta agenți AI eficienți și orientați spre protecția datelor.
Recomandate

Grecia pariază pe detectarea timpurie a incendiilor cu o constelație de nanosateliți și modele de inteligență artificială, un proiect de circa 200 de milioane de euro finanțat de UE, care ar trebui să reducă pagubele prin intervenții mai rapide , potrivit Adevărul , care citează Euronews . Grecia a devenit prima țară care a desfășurat o constelație de sateliți dedicată exclusiv detectării timpurii a incendiilor de vegetație. Sistemul este dezvoltat de compania OroraTech și promite alerte aproape în timp real, cu informații transmise automat către autorități. Cum funcționează sistemul și ce aduce nou operațional Primii patru nanosateliți au fost plasați pe orbita joasă a Pământului în luna mai. Fiecare are aproximativ dimensiunea unui cuptor cu microunde și include senzori termici care pot identifica focare de incendiu de până la patru metri, o performanță peste cea a sateliților convenționali, conform relatării Euronews. Imaginile sunt procesate de modele de inteligență artificială care separă incendiile reale de alte surse de căldură și trimit alerte către serviciile conectate. Directorul general al OroraTech, Ioannis Landouris, a descris o analiză la nivel de „celule de grilă” de 4 pe 4 metri, pe baza căreia sistemul decide dacă este vorba despre un incendiu și transmite informația către pompieri sau alte autorități. De ce contează: mai puține alarme false și decizii mai rapide în teren În momentul detectării, pompierii primesc date despre locația exactă, dimensiunea și intensitatea focarului. Platforma permite și simularea evoluției incendiului, pentru ca echipele de comandă să poată decide mai bine unde trimit resursele și cum le distribuie. Ministrul grec al guvernării digitale, Dimitris Papastergiou, a indicat utilitatea în sezonul estival, mai ales pentru incendii izbucnite în parcuri naționale sau zone izolate, unde observarea de către populație poate întârzia. Sistemul este proiectat să reducă alarmele false generate de panouri fotovoltaice, acoperișuri industriale supraîncălzite sau stânci încălzite de soare, prin algoritmi antrenați special pentru aceste situații. Calendar și costuri Potrivit comandantului pompierilor, Zisoula Dasiou, cei patru sateliți vor furniza date actualizate la fiecare oră, fără întreruperi de acoperire, ceea ce ar susține atât detectarea timpurie, cât și modelele de estimare a răspândirii incendiilor. Costul total al rețelei este de aproximativ 200 de milioane de euro (aprox. 1 miliard lei), finanțarea fiind asigurată de Uniunea Europeană . Proiectul ar urma să fie finalizat până la sfârșitul anului, pe fondul scăderii costurilor de producție și lansare pentru nanosateliți. [...]

OpenAI discută acordarea către guvernul SUA a unei participații de 5% , într-un demers care ar putea fixa din timp un rol direct al Washingtonului în acționariatul marilor laboratoare de inteligență artificială, înaintea unor listări la bursă, potrivit Tom's Hardware . Informația este relatată de Financial Times , care citează două persoane familiarizate cu discuțiile. Propunerea ar fi fost avansată de CEO-ul OpenAI, Sam Altman, și ar include un mecanism mai amplu: fiecare dezvoltator american important de inteligență artificială ar contribui cu aceeași cotă de 5% din capital la un vehicul inspirat de Alaska Permanent Fund, fond care plătește anual dividende rezidenților statului Alaska din veniturile petroliere. La evaluarea de 852 miliarde dolari (aprox. 3.920 miliarde lei) stabilită de OpenAI în runda de finanțare din martie, o participație de 5% ar valora circa 42,6 miliarde dolari (aprox. 196 miliarde lei). Financial Times descrie discuțiile drept conceptuale și într-un stadiu incipient și notează că implementarea ar putea necesita o lege adoptată de Congres. Ce ar însemna, practic, o „cotă publică” în AI Altman ar fi discutat ideea cu președintele Donald Trump, cu secretarul Comerțului Howard Lutnick și cu secretarul Trezoreriei Scott Bessent și ar fi vorbit, în ultimele săptămâni, și cu senatorul Bernie Sanders (independent, Vermont). Structura „toate laboratoarele” ar presupune atragerea de participații și de la companii precum Google, Meta și Anthropic, însă, potrivit materialului, niciuna dintre acestea nu a indicat că ar participa. OpenAI a refuzat să comenteze pentru Financial Times, iar Casa Albă nu a răspuns imediat solicitărilor, conform aceleiași relatări. Context: presiune politică și precedentul din industria de cipuri Propunerea de 5% este prezentată ca fiind cea mai mică cifră vehiculată până acum în discuțiile despre proprietate publică în sectorul AI. În iunie, Bernie Sanders a depus proiectul „ American AI Sovereign Wealth Fund Act ”, care ar urmări 50% din acțiunile cu drept de vot ale companiilor americane de AI printr-un fond evaluat de biroul său la 7.000 miliarde dolari (aprox. 32.200 miliarde lei), suficient – în viziunea inițiatorului – pentru un dividend anual de 1.000 dolari (aprox. 4.600 lei) pentru fiecare american. Administrația ar fi aplicat deja o logică similară în zona semiconductorilor: guvernul federal a preluat o participație de 9,9% în Intel în august anul trecut, prin conversia granturilor din CHIPS Act în acțiuni la 20,47 dolari pe acțiune (aprox. 94 lei). Totodată, AMD și Nvidia ar fi acceptat să cedeze 15% din veniturile din cipuri obținute în China în schimbul licențelor de export, potrivit articolului. De ce contează momentul: înainte de IPO și după amânarea GPT-5.6 Discuțiile apar la șase zile după ce OpenAI a amânat lansarea publică completă a GPT-5.6 la cererea guvernului, iar Lutnick ar fi avertizat împotriva lansării fără aprobare prealabilă. În paralel, Anthropic a avut o parte din iunie modelele Claude Fable 5 și Mythos 5 dezactivate la nivel global, în urma primelor controale de export americane aplicate unui model de AI (nu hardware-ului), accesul fiind restabilit „ieri”, conform materialului. În acest context, o participație guvernamentală negociată înainte de o listare ar putea „bloca” poziția Washingtonului înainte ca o ofertă publică inițială să dilueze acționariatul. Articolul mai notează că atât OpenAI, cât și Anthropic au depus confidențial documentație pentru IPO și că OpenAI se confruntă cu o investigație a unei coaliții de 42 de procurori generali ai statelor americane. [...]

Google reduce costurile și timpul de generare pentru media generativă prin lansarea modelului de imagini Nano Banana 2 Lite și prin deschiderea către dezvoltatori a Gemini Omni Flash pentru generare și editare video, potrivit Google Blog . Miza practică: fluxuri de lucru mai ieftine și mai rapide pentru aplicații care produc volume mari de imagini și clipuri, cu integrare directă în instrumentele Google pentru dezvoltatori și în unele produse pentru consumatori. Nano Banana 2 Lite este prezentat drept „cel mai rapid” și „cel mai eficient ca preț” model din familia Gemini Image, orientat spre utilizare la scară (throughput ridicat) și latență mică. Google indică o latență de 4 secunde pentru ieșiri text-to-image și un cost de 0,034 dolari per imagine la rezoluție 1K (aprox. 0,16 lei), poziționând modelul ca opțiune pentru prototipare interactivă și pipeline-uri în care costul este constrângerea principală. Compania spune că Nano Banana 2 Lite este recomandatul înlocuitor pentru dezvoltatorii care folosesc prima versiune Nano Banana (gemini-2.5-flash-image). Ce se schimbă operațional pentru dezvoltatori Disponibilitatea este extinsă simultan pe mai multe canale, ceea ce reduce fricțiunea de implementare pentru echipele care lucrează deja în ecosistemul Google: Nano Banana 2 Lite este disponibil în Nano Banana 2 Lite , în Google AI Studio , în Gemini API și în Gemini Enterprise Agent Platform . În paralel, Google spune că modelul începe să fie introdus și în suprafețe pentru consumatori, inclusiv AI Mode din Search, aplicația Gemini , NotebookLM, Google Photos, Stitch, Google Flow și Google Ads. Gemini Omni Flash ajunge „pentru prima dată” la dezvoltatori în Gemini Omni Flash , în Google AI Studio , în Gemini API și în aceeași platformă enterprise. Modelul este disponibil și în aplicația Gemini și în Google Flow. Din perspectiva costurilor, Google precizează că Omni Flash este tarifat la 0,10 dolari pe secundă de video generat (aprox. 0,47 lei), la același nivel cu Veo 3.1 Fast. De ce contează: cost pe unitate și viteză, nu doar „calitate” Google își construiește mesajul în jurul a două constrângeri tipice în producția de media generativă: latența (timpul până la rezultat) și costul per unitate (imagine sau secundă de video). Nano Banana 2 Lite este descris ca fiind optimizat pentru „near-real-time” și volume mari, iar Omni Flash ca un model „cost-efficient” pentru generare și editare video conversațională (adică editare prin comenzi în limbaj natural). Publicația susține că cele două modele pot fi „înlanțuite” într-un flux cap-coadă: imagine generată rapid cu Nano Banana 2 Lite, apoi animată în video cu Omni Flash. Pentru experiențe cu mai multe iterații, Google menționează folosirea Interactions API pentru păstrarea contextului și istoricului sesiunii, cu până la trei editări secvențiale. Limitări declarate pentru Omni Flash Google notează explicit câteva limitări operaționale, relevante pentru planificarea produselor: generările video sunt, deocamdată, de 10 secunde , cu durate mai lungi „în curând”; încărcarea de referințe audio și „scene extension” nu sunt suportate în Gemini API pentru acest model; referințele video de până la 3 secunde sunt acceptate de schema API, dar nu sunt procesate corect de model „în acest moment”; consistența personajelor între scene sau la mișcări de panoramare are limitări, pe care compania spune că lucrează să le îmbunătățească. Siguranță și verificare a conținutului Google afirmă că Gemini Omni și Nano Banana 2 Lite folosesc SynthID (watermarking, adică marcaj invizibil pentru identificarea conținutului generat de AI) și că verificarea se poate face prin aplicația Gemini, Gemini în Chrome sau Search. Pentru dezvoltatori, concluzia practică este că Google împinge media generativă către un model de utilizare „industrială”: costuri unitare explicite, timpi de răspuns scurți și integrare directă în API-uri și instrumente enterprise, dar cu limitări încă active pe partea de video, pe care echipele trebuie să le trateze ca riscuri de produs în faza de implementare. [...]

Utilizarea ChatGPT se adâncește pe măsură ce baza de utilizatori se globalizează , arată o analiză publicată de OpenAI , bazată pe date agregate din „ OpenAI Signals ”. Concluzia cu impact operațional pentru companii și organizații este că, odată ce utilizatorii adoptă instrumentul, tind să îl folosească mai des și pentru mai multe tipuri de sarcini, iar creșterea vine tot mai mult din afara piețelor tradițional „anglofone”. Utilizarea crește în intensitate și în varietatea sarcinilor Potrivit analizei, după șase luni de la înscriere, utilizatorii trimit cu 50% mai multe mesaje pe zi decât la momentul inițial. În același interval, ei își dublează numărul de „sarcini distincte” încercate în ChatGPT, măsurate printr-un sistem de clasificare care grupează mesajele în 53 de categorii. Setul de date folosit este un eșantion de 0,1% dintre utilizatori cu conturi create între 15 octombrie 2025 și 1 mai 2026, cu activitate urmărită până la 31 mai 2026. Sunt excluși utilizatorii sub 18 ani, utilizatorii blocați și cei care nu trimit niciun mesaj în primele 28 de zile de la crearea contului. Accelerare regională, cu ritm relativ mai rapid în Africa și Asia OpenAI indică o creștere accentuată a adoptării pe toate continentele din iulie 2023, însă, în termeni relativi, Africa și Asia au înregistrat cele mai rapide avansuri ale numărului de utilizatori activi săptămânal. Un tipar similar apare și pe grupe de țări în funcție de Indicele Dezvoltării Umane (HDI): țările cu HDI mai redus au avut cea mai rapidă creștere relativă a utilizatorilor activi săptămânal din iulie 2023. Publicația leagă această evoluție și de accesul cu cost redus prin planurile Free și Go . În această analiză, un utilizator este considerat activ dacă a trimis un mesaj în cele șapte zile dinaintea începutului fiecărei luni; sunt excluse țările în care ChatGPT nu operează și utilizatorii sub 18 ani. Baza de utilizatori devine mai diversă: mai multe limbi, estimări pe baza numelor Datele OpenAI Signals sugerează că utilizarea asociată cu persoane cu nume „tipic feminine” a crescut și reprezintă acum majoritatea utilizării la nivel global. OpenAI precizează însă că nu colectează genul utilizatorilor, iar estimarea se bazează pe corelări nume–gen; sunt excluși utilizatorii ale căror nume nu pot fi clasificate, iar unele țări sunt omise dacă cel puțin jumătate dintre nume nu pot fi încadrate. În paralel, utilizarea non-engleză a crescut odată cu extinderea globală: utilizatorii care folosesc predominant o altă limbă decât engleza reprezintă acum peste jumătate dintre utilizatorii activi. Cele mai folosite limbi non-engleze sunt spaniola, portugheza și araba, iar uzbeca, kazaha și birmaneza au avut cele mai mari creșteri procentuale ale ponderii în rândul utilizatorilor activi (în rândul limbilor cu cel puțin 1 milion de utilizatori activi în iunie 2026). Ce urmează: date pentru cercetare și politici publice OpenAI prezintă „OpenAI Signals” ca un demers continuu de publicare de date pentru a ajuta cercetătorii și factorii de decizie să înțeleagă efectele inteligenței artificiale asupra economiei. Seturile de date pot fi consultate și descărcate din paginile dedicate: „has increased” (OpenAI Signals data) și „here” (data download), menționate în material. [...]

Gemini Spark ajunge pe macOS și poate automatiza sarcini direct în fișierele de pe desktop , o extindere care mută asistentul din zona de chat către execuție efectivă de „muncă” pe calculator, potrivit Google Blog . Actualizarea vine la pachet cu mai multe integrări cu aplicații și cu o funcție de urmărire în timp real a subiectelor, inclusiv pentru știri și finanțe. macOS: automatizări pe fișiere și aplicații, cu acces pe bază de permisiuni Google spune că aduce Spark în aplicația Gemini pentru macOS pentru a automatiza „sarcini consumatoare de timp” la nivelul desktopului. Exemplul dat este sortarea automată a fișierelor PDF din folderul Downloads în directoare specifice, la cerere. O altă utilizare descrisă este legarea fișierelor locale de Google Workspace: utilizatorul poate cere crearea unui tabel de buget pe baza celor mai recente facturi salvate pe computer și programarea unor actualizări regulate. Din perspectiva controlului accesului, compania precizează că Spark „are acces doar la fișierele pentru care îi acorzi permisiunea”. Urmează execuția de sarcini de la distanță, inițiată de pe telefon Google anunță și o funcție „în curând” pentru rularea de sarcini de la distanță: utilizatorul va putea atribui din telefon o sarcină în mai mulți pași care să fie executată pe Mac cât timp nu este la computer. Ca exemplu, compania menționează că Spark ar putea căuta un raport de vânzări pe Mac, extrage cifra de venit total și trimite rezultatul pe e-mail. Disponibilitate: beta, doar pentru abonați Google AI Ultra , inițial în SUA Gemini Spark pentru macOS este disponibil în versiune beta pentru abonații Google AI Ultra cu vârsta de peste 18 ani, începând din SUA. Google indică drept punct de descărcare pagina gemini.google/mac. Integrări cu aplicații și suport pentru MCP Pe lângă macOS, Google extinde lista de „aplicații conectate” (integrări) pentru Spark. Sunt menționate: Google Tasks și Google Keep (transformarea notițelor din Keep în acțiuni în Tasks); Canva, Dropbox, Instacart, OpenTable și Zillow Rentals. Aceste integrări ar urma să se lanseze „în următoarea săptămână” pe web și mobil, iar pentru aplicația macOS „în următoarele săptămâni”. Separat, Google spune că introduce suport pentru Model Context Protocol (MCP) , care permite conectarea unor aplicații preferate direct în Spark pentru un asistent mai „personalizat” (protocolul este un mecanism de integrare care ajută un model să primească context și să interacționeze cu servicii externe). Monitorizare în timp real: inclusiv alerte și rapoarte financiare O altă schimbare este capacitatea Spark de a urmări subiecte și de a reacționa la evenimente în timp real. Google dă ca exemplu trimiterea unui „raport financiar detaliat” dacă o acțiune atinge un anumit prag. Spark poate urmări bloguri, site-uri de știri, rețele sociale, finanțe, cumpărături, vreme și sport, pe lângă e-mail. Google afirmă că actualizările încep să fie livrate „de astăzi” și promite mai multe detalii despre ce urmează pentru Spark „în această vară”. [...]

Google introduce o voce nouă în Google Maps pentru Noua Zeelandă, care pronunță corect toponimele în te reo Māori , o schimbare cu impact operațional direct pentru utilizatori și pentru calitatea serviciului de navigație, potrivit Google Blog . Actualizarea folosește un model de tip „text-to-speech” (transformă textul în vorbire) și combină engleza cu accent neozeelandez („Kiwi”) cu pronunția fidelă a denumirilor indigene. Funcția începe să fie disponibilă de astăzi și se distribuie la nivel global pe Android, iOS, Android Auto și CarPlay. Pentru a o activa, utilizatorii trebuie să își actualizeze aplicația și să seteze limba la „English (New Zealand)”. Ce se schimbă concret în utilizare Noua voce urmărește să reducă erorile de pronunție în timpul navigației, în special pentru nume de orașe și regiuni, precum „Taranaki” și „Whangārei”, menționate ca exemple în material. Din perspectiva utilizatorului, schimbarea este una de „calitate a interacțiunii”: indicațiile rămân în engleză, dar numele de locuri sunt rostite corect în te reo Māori. Cum a fost construită vocea și cine a fost implicat Google spune că a lucrat cu experți lingvistici de la Te Taura Whiri (Comisia pentru Limba Māori) și a folosit date publice ale New Zealand Geographic Board pentru a construi vocea și a calibra pronunțiile. În articol este inclusă și o declarație a lui Ngahiwi Apanui-Barr, director executiv al Te Taura Whiri, care leagă pronunția corectă de accesul la semnificațiile culturale ale toponimelor: „Numele de locuri Māori poartă povești care ne conectează la istoriile, oamenii și realizările noastre. Primul pas pentru a debloca aceste povești este pronunția corectă. Dacă putem auzi cuvintele spuse corect, putem spune cuvintele corect.” Componenta de guvernanță a datelor: suveranitatea datelor Māori Un element distinct al proiectului este modul în care Google descrie gestionarea datelor lingvistice: „suveranitatea datelor Māori” și principiile companiei privind inteligența artificială ( AI Principles ) au fost „centrale” în dezvoltarea modelului. Inițial, Te Taura Whiri ar urma să fie „kaitiaki” (gardian) al lexiconului te reo Māori, iar pe termen lung planul este crearea unui grup de custodi care să asigure accesul și beneficiile pentru mediul academic, cercetători și comunități Māori, precum și sustenabilitatea „kaupapa” (misiunii). În context, Google notează și relevanța culturală a limbii: te reo Māori este recunoscută în Noua Zeelandă drept „taonga” (comoară), este una dintre cele două limbi oficiale (alături de limbajul semnelor), iar 73% dintre neozeelandezi au spus că o consideră o parte importantă a culturii și identității țării (sondaj Verian, 2025). [...]